FILTER MODE ACTIVE

#масштабирование RL

Найдено записей: 1

#масштабирование RL12.08.2025

ProRLv2: NVIDIA удлиняет RL до 3000 шагов и усиливает способность LLM к рассуждению

ProRLv2 увеличивает горизонт RL до 3000 шагов и демонстрирует значительные улучшения рассуждения в компактных языковых моделях, подтверждённые приростами по математике, кодированию и логике.